智能论文笔记

Textual Entailment Recognition with Semantic Features from Empirical Text Representation

Md Atabuzzaman , Md Shajalal , Maksuda Bilkis Baby , Md Rezaul Karim

分类：自然语言处理 | 人工智能

2022-10-18

Textual entailment recognition is one of the basic natural language understanding(NLU) tasks. Understanding the meaning of sentences is a prerequisite before applying any natural language processing(NLP) techniques to automatically recognize the textual entailment. A text entails a hypothesis if and only if the true value of the hypothesis follows the text. Classical approaches generally utilize the feature value of each word from word embedding to represent the sentences. In this paper, we propose a novel approach to identifying the textual entailment relationship between text and hypothesis, thereby introducing a new semantic feature focusing on empirical threshold-based semantic text representation. We employ an element-wise Manhattan distance vector-based feature that can identify the semantic entailment relationship between the text-hypothesis pair. We carried out several experiments on a benchmark entailment classification(SICK-RTE) dataset. We train several machine learning(ML) algorithms applying both semantic and lexical features to classify the text-hypothesis pair as entailment, neutral, or contradiction. Our empirical sentence representation technique enriches the semantic information of the texts and hypotheses found to be more efficient than the classical ones. In the end, our approach significantly outperforms known methods in understanding the meaning of the sentences for the textual entailment classification task.

translated by 谷歌翻译

Comparative Analysis of Clustering Techniques for Personalized Food Kit Distribution

Jude Francis , Rowan K Baby , Jacob Abraham , Ajmal P. S

分类：机器学习 | (统计)机器学习

2022-12-30

The Government of Kerala had increased the frequency of supply of free food kits owing to the pandemic, however, these items were static and not indicative of the personal preferences of the consumers. This paper conducts a comparative analysis of various clustering techniques on a scaled-down version of a real-world dataset obtained through a conjoint analysis-based survey. Clustering carried out by centroid-based methods such as k means is analyzed and the results are plotted along with SVD, and finally, a conclusion is reached as to which among the two is better. Once the clusters have been formulated, commodities are also decided upon for each cluster. Also, clustering is further enhanced by reassignment, based on a specific cluster loss threshold. Thus, the most efficacious clustering technique for designing a food kit tailored to the needs of individuals is finally obtained.

translated by 谷歌翻译

Solving the Baby Intuitions Benchmark with a Hierarchically Bayesian Theory of Mind

Tan Zhi-Xuan , Nishad Gothoskar , Falk Pollok , Dan Gutfreund , Joshua B. Tenenbaum , Vikash K. Mansinghka

分类：人工智能

2022-08-04

为了促进开发新模型以弥合机器和人类社会情报之间的差距，最近提议的婴儿直觉基准（Arxiv：2102.11938）提供了一系列任务，旨在评估代理商的目标和行动，即使是年轻的婴儿也表现出的表现，。在这里，我们根据层次的贝叶斯心理理论（HBTOM）提出了该基准的原则性贝叶斯解决方案。通过在代理目标和处置上包括层次的先验，对我们的HBTOM模型的推断几乎可以学习代理的效率和偏好，然后可以将其用于常识性的合理性判断，以判断有关后续代理行为。这种方法在大多数基准任务上实现了几乎完美的准确性，在产生可解释的人类的推论的同时，超过了深度学习和模仿学习基准，证明了结构化贝叶斯人的人类社会认知模型的优势。

translated by 谷歌翻译

Optimal Dynamic Regret in LQR Control

Dheeraj Baby , Yu-Xiang Wang

分类：机器学习 | (统计)机器学习

2022-06-18

我们考虑了具有一系列二次损耗的序列，即LQR控制的问题。我们提供了一种有效的在线算法，该算法实现了$ \ tilde {o}的最佳动态（策略）遗憾（\ text {max} \ {n^{n^{1/3} \ mathcal {tv}（m_ {1：n}）^{2/3}，1 \}）$，其中$ \ Mathcal {tv}（m_ {1：n}）$是任何Oracle序列序列的总变化，由$ M_1，...，...，...，...，...，...，...，...，...，...，...，...，...，...m_n $ - 事后选择以迎合未知的非机构性。该费率提高了$ \ tilde {o}（\ sqrt {n（\ Mathcal {tv}}（m_ {1：n}）+1）} $的最佳已知费率（\ sqrt {N（\ Mathcal {tv}}）$ - 理论上最佳的LQR。主要技术组件包括将LQR减少到在线线性回归，并延迟由于Foster和Simchowitz（2020）而延迟反馈，以及具有最佳$ \ tilde {o}（n^{1/3}）的新的适当学习算法（N^{1/3}）$动态的遗憾是``小匹配''二次损失的家庭，这可能引起独立的兴趣。

translated by 谷歌翻译

Context-based out-of-vocabulary word recovery for ASR systems in Indian languages

Arun Baby , Saranya Vinnaitherthan , Akhil Kerhalkar , Pranav Jawale , Sharath Adavanne , Nagaraj Adiga

分类：自然语言处理

2022-06-09

对于自动语音识别（ASR）系统而言，检测和恢复量不足（OOV）单词总是具有挑战性的。许多现有的方法着重于通过修改声学和语言模型并巧妙地集成到模型的上下文单词来对OOV单词进行建模。为了培训这样的复杂模型，我们需要大量数据，其中包括上下文单词，额外的训练时间和增加模型大小。但是，在获取ASR转录以恢复基于上下文的OOV单词之后，对后处理方法的探索并未得到太多探索。在这项工作中，我们提出了一种后处理技术，以提高基于上下文的OOV恢复的性能。我们创建了一个具有声音增强的语言模型，并在电话级上用OOV单词列表制作了子图。我们提出了两种方法来确定合适的成本函数，以根据上下文检索OOV单词。成本函数是根据语音和声学知识来定义的，用于匹配和恢复解码中的正确上下文单词。在文字级别和句子级别上都评估了提议的成本函数的有效性。评估结果表明，这种方法可以平均在多个类别中恢复50％基于上下文的OOV单词。

translated by 谷歌翻译

Impact of Environmental Noise on Alzheimer's Disease Detection from Speech: Should You Let a Baby Cry?

Jekaterina Novikova

分类：自然语言处理

2022-03-31

鉴于AD的高流行和传统方法的高成本，与自动检测阿尔茨海默氏病（AD）有关的研究很重要。由于广告会显着影响自发语音的声学，因此语音处理和机器学习（ML）为可靠地检测AD提供了有希望的技术。但是，语音音频可能会受到不同类型的背景噪声的影响，重要的是要了解噪声如何影响ML模型检测到语音的AD的准确性。在本文中，我们研究了来自五个不同类别的15种类型的环境噪声对四种具有三种声音表示的ML模型的性能的影响。我们进行了彻底的分析，显示了ML模型和声学特征如何受到不同类型的声学噪声的影响。我们表明声音噪声不一定是有害的 - 某些类型的噪声对AD检测模型有益，并帮助将精度提高到4.8％。我们提供有关如何利用声学噪声的建议，以通过在现实世界中部署的ML模型获得最佳性能结果。

translated by 谷歌翻译

Dynamic Regret for Strongly Adaptive Methods and Optimality of Online KRR

Dheeraj Baby , Hilaf Hasson , Yuyang Wang

分类：机器学习 | (统计)机器学习

2021-11-22

我们考虑非静止在线凸优化的框架，其中学习者寻求控制其动态遗憾，免于任意比较器序列。当损耗函数强烈凸或exy-yshave时，我们证明了强烈的自适应（SA）算法可以被视为在比较器序列的路径变化$ V_T $的路径变化中控制动态遗憾的原则方式。具体来说，我们展示了SA算法享受$ \ tilde o（\ sqrt {tv_t} \ vee \ log t）$和$ \ tilde o（\ sqrt {dtv_t} \ vee d \ log t）$动态遗憾强烈凸Exp-Trowave损失分别没有APRIORI $ v_t $。本发明进一步展示了原理方法的多功能性，在与高斯内核的界限线性预测器和在线回归的环境中进一步证明了原则方法。在一个相关的环境下，纸张的第二个组件解决了Zhdanov和Kalnishkan（2010）提出的一个开放问题，涉及与平方误差损失的在线内核回归。我们在一定处罚后悔的新下限，该遗憾地建立了在线内核Ridge回归（KRR）的近极低最低限度。我们的下限可以被视为vovk（2001）中派生的rkhs扩展，以便在有限维中在线线性回归。

translated by 谷歌翻译

A semi-agnostic ansatz with variable structure for quantum machine learning

M. Bilkis , M. Cerezo , Guillaume Verdon , Patrick J. Coles , Lukasz Cincio

分类：机器学习 | (统计)机器学习

2021-03-11

Quantum Machine Learning（QML）提供了一种强大的灵活的范式，可用于编程近期量子计算机，具有化学，计量，材料科学，数据科学和数学的应用。这里，一个以参数化量子电路的形式训练ANSATZ，以实现感兴趣的任务。然而，最近出现了挑战表明，由于随机性或硬件噪声引起的平坦训练景观，因此难以训练深度尖锐钽。这激励了我们的工作，在那里我们提出了一种可变的结构方法来构建QML的Ansatzes。我们的方法称为VANS（可变ANSATZ），将一组规则应用于在优化期间以知识的方式在增长和（至关重要的）中删除量子门。因此，VANS非常适合通过保持ANSATZ浅扫描来缓解训练性和与噪声相关的问题。我们在变分量子Eigensolver中使用Vans进行冷凝物质和量子化学应用，并且还在量子自身化学器中进行数据压缩，显示所有情况的成功结果。

translated by 谷歌翻译

Baby Intuitions Benchmark (BIB): Discerning the goals, preferences, and actions of others

Kanishk Gandhi , Gala Stojnic , Brenden M. Lake , Moira R. Dillon

分类：人工智能 | 机器学习

2021-02-23

为了实现对日常生活的人类常识，机器学习系统必须理解和理解环境中其他代理人的目标，偏好和行动。在他们的第一年的生命结束时，人类婴儿直观地实现了如此常识，这些认知成就为人类丰富而复杂地了解他人的心理状态。Can Machines可以实现更广泛的，致辞推理对人类婴儿这样的其他药剂吗？婴儿直觉的基准（围兜）挑战机器，以预测代理人行为的合理性，基于其行动的基本原因。由于BIB的内容和范式从发育认知科学中采用，因此BIB允许在人类和机器性能之间直接比较。尽管如此，最近提出的深度学习的机构推理模型未能表现出婴儿的推理，让围兜成为一个开放的挑战。

translated by 谷歌翻译